Ước lượng sai số là gì? Các nghiên cứu khoa học liên quan
Ước lượng sai số là quá trình xác định một khoảng tin cậy toàn diện gắn với kết quả đo hoặc tính toán, thể hiện mức độ không chắc chắn của số liệu. Quá trình này bao gồm đánh giá sai số hệ thống, ngẫu nhiên bằng phương pháp loại A, loại B và mô phỏng Monte Carlo, đảm bảo độ tin cậy kết quả đo.
Khái niệm và mục đích
Ước lượng sai số (uncertainty estimation) là quá trình xác định khoảng tin cậy cho giá trị đo hoặc kết quả tính toán, cho biết mức độ không chắc chắn gắn liền với con số báo cáo. Đây không phải là sai số hệ thống hay sai số ngẫu nhiên cụ thể, mà là một đại lượng tổng hợp biểu thị phạm vi mà trong đó giá trị thực khả dĩ nằm trong đó với một xác suất nhất định.
Mục tiêu chính của ước lượng sai số bao gồm: đảm bảo kết quả đo lường có thể so sánh được giữa các phòng thí nghiệm, thuyết phục người dùng về độ tin cậy của số liệu, và tuân thủ các tiêu chuẩn quốc tế như ISO/IEC 17025. Việc ước lượng sai số cũng hỗ trợ đánh giá hiệu suất hệ thống đo và xác định khoảng cải tiến để nâng cao chất lượng dữ liệu.
- Đánh giá độ tin cậy số liệu đo lường
- So sánh kết quả giữa các nghiên cứu, phòng thí nghiệm
- Tuân thủ tiêu chuẩn chất lượng (ISO, ASTM, GUM)
Phân loại sai số và bất định
Sai số trong đo lường được chia làm hai nhóm chính: sai số hệ thống (systematic error) và sai số ngẫu nhiên (random error). Sai số hệ thống là lệch có thể lặp lại và dự đoán được, phát sinh do lỗi hiệu chuẩn, phương pháp đo, hoặc điều kiện môi trường cố định. Ngược lại, sai số ngẫu nhiên là sự dao động ngẫu nhiên của kết quả đo khi thực hiện nhiều lần, do nhiễu nền, biến đổi nhiệt độ, hay nhiễu điện.
Bất định chuẩn (standard uncertainty) được xác định từ cả hai nguồn trên, chia thành hai loại đánh giá:
- Phương pháp loại A: dựa trên thống kê số liệu thu được từ nhiều phép đo lặp lại, tính độ lệch chuẩn mẫu.
- Phương pháp loại B: đánh giá từ thông tin bên ngoài như dữ liệu lịch sử, tài liệu kỹ thuật, chứng nhận hiệu chuẩn, hoặc kinh nghiệm chuyên gia.
Bất định mở rộng (expanded uncertainty) được tính bằng cách nhân bất định chuẩn tổng hợp với hệ số mở rộng , thường chọn để đạt khoảng tin cậy ~95%.
Cơ sở toán học
Khi kết quả đo được tính từ các đại lượng độc lập qua một hàm số , tức , bất định chuẩn tổng hợp được xác định theo công thức tuyến tính hóa bậc nhất:
Trong đó là bất định chuẩn của từng biến đầu vào , và là đạo hàm riêng của hàm số theo , biểu thị độ nhạy của kết quả trước biến động của .
Thành phần | Ý nghĩa |
---|---|
Mô hình đo hoặc phương trình tính kết quả | |
Độ nhạy của kết quả đối với | |
Bất định chuẩn của biến | |
Bất định chuẩn tổng hợp của kết quả |
Phương pháp xác định bất định
Phương pháp loại A xác định bất định chuẩn từ dữ liệu thí nghiệm lặp lại. Khi thực hiện phép đo độc lập thu được các giá trị , bất định chuẩn mẫu được tính theo độ lệch chuẩn:
Phương pháp loại B dùng thông tin ngoài, ví dụ sai số hiệu chuẩn thiết bị do nhà sản xuất cung cấp, hoặc phân bố chuẩn cho phép ước lượng gián tiếp. Bất định loại B được xác định bằng cách phân tích phân phối xác suất giả định (tam giác, chữ nhật, chuẩn, v.v.).
Phương pháp | Nguồn dữ liệu | Ưu điểm | Hạn chế |
---|---|---|---|
Loại A | Dữ liệu đo lặp | Độ tin cậy cao, cơ sở thống kê | Cần nhiều phép đo |
Loại B | Thông số kỹ thuật, tài liệu | Không cần lặp nhiều, ứng dụng nhanh | Phụ thuộc giả định phân phối |
Bất định chuẩn tổng hợp được tính bằng cách kết hợp bất định loại A và B theo quy tắc cộng bình phương. Sau đó, bất định mở rộng được xác định bằng:
Thông thường chọn hệ số để đạt khoảng tin cậy xấp xỉ 95%, phù hợp hướng dẫn GUM của JCGM.
Bất định chuẩn và hệ số mở rộng
Bất định chuẩn tổng hợp biểu thị độ lệch chuẩn của kết quả đo đã kết hợp cả nguồn sai số hệ thống và ngẫu nhiên. Giá trị này thể hiện phạm vi dao động của kết quả đo xung quanh giá trị trung bình với xác suất xấp xỉ 68% khi giả định phân phối chuẩn.
Bất định mở rộng được tính thông qua hệ số mở rộng nhân với bất định chuẩn tổng hợp:
Thông thường chọn để đạt khoảng tin cậy xấp xỉ 95%, hoặc cho khoảng tin cậy ~99,7%. Việc lựa chọn hệ số phải dựa trên yêu cầu độ tin cậy của kết quả đo và tiêu chuẩn ngành áp dụng.
Hệ số | Khoảng tin cậy | Ứng dụng phổ biến |
---|---|---|
1 | 68% | Phân tích sơ bộ, giám sát nội bộ |
2 | 95% | Báo cáo kết quả chính thức, so sánh liên phòng thí nghiệm |
3 | 99.7% | Đánh giá rủi ro cao, chứng nhận chất lượng |
Mô hình đo và biểu diễn
Mô hình đo là phương trình toán học hoặc thuật toán xác định mối quan hệ giữa kết quả và các biến đầu vào . Việc xây dựng mô hình đo đầy đủ bao gồm xác định tham số, điều kiện đo, và giới hạn áp dụng.
Kết quả cuối cùng thường được biểu diễn dưới dạng:
- (đi kèm đơn vị đo),
- Giá trị trung bình và khoảng tin cậy .
Khi báo cáo, cần nêu rõ:
- Phương trình mô hình và các biến đầu vào,
- Giá trị bất định chuẩn tổng hợp và hệ số ,
- Giả định về phân phối, điều kiện môi trường và phương pháp thu thập dữ liệu.
Phép nhân đoàn và phân phối
Khi kết quả cuối cùng là tích hoặc thương của nhiều đại lượng, bất định tương đối được tính như sau:
Công thức này áp dụng khi các biến độc lập và tương đối nhỏ so với giá trị trung bình. Phương pháp này cho phép tổng hợp bất định qua chuỗi phép tính, thuận tiện cho các phép đo yêu cầu nhiều bước phân tích hoặc biến động liên tục.
Phép tính | Biểu thức bất định tương đối |
---|---|
Nhân | |
Chia |
Phương pháp mô phỏng Monte Carlo
Phương pháp Monte Carlo dùng để xác định phân bố xác suất của kết quả khi mô hình phi tuyến hoặc khi tuyến tính hóa không đủ chính xác. Ý tưởng cơ bản là:
- Sinh ngẫu nhiên mẫu cho mỗi biến đầu vào theo phân phối đã biết (ví dụ chuẩn, tam giác, đều).
- Tính cho mỗi mẫu .
- Phân tích phân bố thu được để xác định giá trị trung bình, độ lệch chuẩn và khoảng tin cậy.
Phương pháp này không yêu cầu tính đạo hàm hoặc tuyến tính hóa, cho kết quả chính xác hơn với mô hình phức tạp. Song, nó đòi hỏi khả năng tính toán cao và lưu trữ lượng lớn mẫu giả lập.
Tham khảo hướng dẫn chi tiết tại JCGM 101: GUM Supplement 1 (2008).
Hướng dẫn và tiêu chuẩn quốc tế
Ước lượng sai số phải tuân theo các tiêu chuẩn quốc tế nhằm đảm bảo tính nhất quán và công nhận lẫn nhau:
- JCGM 100:2008 GUM – “Guide to the Expression of Uncertainty in Measurement” do Joint Committee for Guides in Metrology ban hành.
- JCGM 101:2008 – “Propagation of distributions using a Monte Carlo method”, hướng dẫn bổ sung cho GUM.
- ISO/IEC 17025:2017 – Yêu cầu chung về năng lực của phòng thử nghiệm và hiệu chuẩn.
- ASTM E2754/E2754M-16 – Chuẩn đánh giá bất định trong hiệu chuẩn nhiệt điện trở.
Các tài liệu này quy định chi tiết cách xác định, kết hợp, và báo cáo bất định đo, đồng thời nêu rõ tiêu chí chấp nhận theo từng loại phép đo và ngưỡng rủi ro liên quan.
Tài liệu tham khảo
- Joint Committee for Guides in Metrology (2008). Evaluation of measurement data—Guide to the expression of uncertainty in measurement (GUM). JCGM 100:2008.
- Joint Committee for Guides in Metrology (2008). Evaluation of measurement data—Supplement 1: Propagation of distributions using a Monte Carlo method. JCGM 101:2008.
- International Organization for Standardization (2017). ISO/IEC 17025:2017 General requirements for the competence of testing and calibration laboratories.
- ASTM International (2016). ASTM E2754/E2754M-16 Standard Guide for Determining Uncertainties in Thermocouple Calibration.
- National Institute of Standards and Technology. NIST/SEMATECH e-Handbook of Statistical Methods, Section on Measurement Uncertainty. Truy cập: https://www.itl.nist.gov/div898/handbook/mpc/section1/mpc14.htm
Các bài báo, nghiên cứu, công bố khoa học về chủ đề ước lượng sai số:
- 1
- 2
- 3
- 4